针对司法领域关系抽取任务中模型对句子上下文理解不充分、重叠关系识别能力弱的问题,提出了一种基于刑事Electra (CriElectra)的编-解码关系抽取模型。首先,参考中文Electra的训练方法,在1 000 000份刑事数据集上训练得到了CriElectra;然后,在双向长短期记忆网络(BiLSTM)模型上加入CriElectra的词特征进行司法文本的特征提取;最后,通过胶囊网络(CapsNet)对特征进行矢量聚类,从而实现实体间的关系抽取。实验结果表明,在自构建的故意伤害罪关系数据集上,与基于中文Electra的这一预训练语言模型相比,CriElectra在司法文本上的重训过程使得学习到的词向量蕴含更丰富的领域信息,且F1值提升了1.93个百分点;与基于池化聚类的模型相比,CapsNet通过矢量运算能够有效防止空间信息丢失,并提高重叠关系的识别能力,使得F1值提升了3.53个百分点。
针对肝脏CT图像中因灰度不均、边缘模糊等造成肿瘤难以准确分割的问题,提出了一种消除局部极值的多尺度形态学分割方法。首先利用面积算子对图像进行预处理,在平滑图像的同时,保持目标区域的边缘信息;其次融合梯度图像中不同极值的邻域统计信息和形态属性(深度和尺度)区分极值,通过设定不同大小的结构元素,对不同极值采用多尺度结构元素进行闭运算,在消除伪局部极值的同时实现图像的自适应修正;最后利用分水岭变换分割肝脏肿瘤。实验结果表明,该方法能够在保持图像边缘的同时,有效减轻过分割现象,实现肝脏肿瘤的准确分割。
针对脑部核磁共振成像(MRI)图像因噪声、灰度不均匀、组织结构复杂及边界模糊不连续等造成肿瘤难以准确分割的问题,提出一种基于形态学多尺度修正的模糊C均值(FCM)聚类分割方法。首先根据邻域统计信息引入控制参数用于区分邻域中的噪声点、边缘点和区域内部点,结合空间位置信息建立像素与结构元素大小之间的函数关系;然后利用不同大小的结构元素对图像中不同类型像素进行形态学闭运算,消除对应于局部极小值的噪声干扰和非规则细节,而目标部分的区域轮廓位置基本保持不变;最后在修正基础上进行FCM聚类分割,避免FCM陷入局部极优和误分类,同时保持区域轮廓准确定位。与标准FCM、核FCM(KFCM)、遗传FCM(GFCM)、模糊局部信息C均值(FLICM)等改进方法以及专家手工勾画结果进行了对比,实验结果表明,该方法的过分割率和欠分割率较低,且与标准分割的相似度指数和JS值均较高,具有较好的分割效果。